ViBE: Co-optimizando desviación de carga y variabilidad de hardware para MoE
ViBE reduce el desequilibrio en la ejecución de MoE hasta un 45% en P90 TTFT, mejorando el cumplimiento de SLO en un 14%. Optimiza colocación de expertos según rendimiento GPU.